# -*- coding: utf-8 -*-
import re
import json
from pprint import pprint
from collections import OrderedDict

# 判断 是图还是表
def chart_or_form(table_list):
    for table_inedx, table in enumerate(table_list):
        for ta in table:
            if ta == '' or ta == None:
                continue
            else:
                return True
    return False

# 过滤表格中的表格
def remove_tables_in_table(find_tables):
    index_set = set()
    for table_index, table in enumerate(find_tables):
        for new_index, new_table in enumerate(find_tables):
            if new_table.bbox[1] > table.bbox[1] and new_table.bbox[3] < table.bbox[3]:
                index_set.add(new_index)

    new_find_tables = []
    for table_index, table in enumerate(find_tables):
        if table_index in index_set:
            continue
        new_find_tables.append(table)

    return new_find_tables

# 去重 List[Dict]
def remove_duplicates(dict_list):
    unique_list = []
    for d in dict_list:
        if d in unique_list:
            continue
        else:
            unique_list.append(d)
    return unique_list

# 过滤page_rects 过滤线条矩形
def remove_page_rects(page_rects):
    unique_list = []
    for index, rects in enumerate(page_rects):
        if rects['bottom'] - rects['top'] <= 10 or rects['x1'] - rects['x0'] <= 10:
            continue
        unique_dict = {'x0': rects['x0'],
                       'top': rects['top'],
                       'x1': rects['x1'],
                       'bottom': rects['bottom']
                       }
        if unique_dict in unique_list:
            continue
        else:
            unique_list.append(unique_dict)
    return unique_list

# extract_tables 和 find_tables 过滤表格中的假图 只保留表格
def remove_extract_find_tables(extract_tables, find_tables):
    extract_unique_list = []
    find_unique_list = []
    for index, table in enumerate(extract_tables):
        if chart_or_form(table):
            extract_unique_list.append(table)
            find_unique_list.append(find_tables[index])

    return extract_unique_list, find_unique_list

# 过滤表格中的图片
def remove_images_in_table(page_images, find_tables):
    new_image_index = []
    for table_index, table in enumerate(find_tables):
        for image_index, image in enumerate(page_images):
            if image['top'] > table.bbox[1] and image['bottom'] < table.bbox[3]:
                new_image_index.append(image_index)

    new_page_images = []
    for index, image in enumerate(page_images):
        if index in new_image_index:
            continue
        else:
            if float(image['bottom']) - float(image['top']) <= 50:  # 图片小于三行文字高度（15.6） 可能截取文字 跳过
                continue
            else:
                new_page_images.append(image)

    # print('new_image_index', new_image_index)
    return new_page_images

# 过滤表格中的矩形
def remove_rects_in_table(rects_list, find_tables, page_height, page_width):
    new_rect_index = []
    for table_index, table in enumerate(find_tables):
        for rect_index, rect in enumerate(rects_list):
            if rect['top'] > table.bbox[1] and rect['bottom'] < table.bbox[3]:
                new_rect_index.append(rect_index)

    new_page_rects = []
    for index, rect in enumerate(rects_list):
        if index in new_rect_index:  # 过滤表格中的矩形
            continue
        else:
            if float(rect['bottom']) - float(rect['top']) <= 50:  # 矩形小于三行文字高度（15.6） 可能截取文字 跳过
                continue
            elif float(rect['bottom']) - float(rect['top']) > float(page_height) - 32:  # 矩形高度 大于页面高度-两行文字高度时 跳过
                continue
            elif float(rect['x1']) - float(rect['x0']) < float(page_width) / 2:  # 矩形宽度 小于页面宽度除2 跳过
                continue
            else:
                new_page_rects.append(rect)

    index_set = set()
    for rects_index, rects in enumerate(new_page_rects):  # 去出矩形中的矩形
        for new_index, new_rects in enumerate(new_page_rects):
            if new_rects['top'] > rects['top'] and new_rects['bottom'] < rects['bottom']:
                index_set.add(new_index)

    New_page_rects = []
    for rect_index, rect in enumerate(new_page_rects):
        if rect_index in index_set:
            continue
        New_page_rects.append(rect)

    # print('new_rect_index', new_rect_index)
    return New_page_rects

# 切分目录获取标题和页码：
def split_directory(directory_list: list):
    '''
    :param directory_list: 目录列表 [标题...页码]
    :return: title_page_list [{标题: str, 页码: int}]
    '''
    title_page_list = []
    for directory in directory_list:
        directory_split = re.split(r'\.{2,}', directory)
        title_page_list.append({'标题': directory_split[0], '页码': int(directory_split[-1])})

    return title_page_list

# 表格转markdown
def table2markdown(table_list):
    # print('table_list:', table_list)
    mark_text = ''
    for row_index, row in enumerate(table_list):
        row_text = '|'
        for cell_inedx, cell in enumerate(row):
            if cell == None:
                cell = ''
            elif cell == '':
                continue
            row_text += cell.strip() + '|'
        mark_text += row_text.replace('\n', '') + '\n'
        # print(row_text)
        if row_index == 0:
            filtered_list = list(filter(lambda x: x != "", row))
            head_text = '|'
            for i in range(len(filtered_list)):
                head_text += ' --- |'
            mark_text += head_text + '\n'
            # print(head_text)
    return mark_text.strip()

# 检测目录剔除非问题的目录标题 例如 "目录" 和 "一 发行人说明"
def check_directory(title_page_list: list):
    '''
    :param title_page_list: 目录列表 [{标题: str, 页码: int}]
    :return: new_title_page_list: 只有问题的目录列表 [{标题: str, 页码: int}]
    '''
    new_title_page_list = []
    for title_page_dict in title_page_list:
        title = re.sub(" ", "", title_page_dict['标题']).strip()
        if title[0] in ['0', '1', '2', '3', '4', '5', '6', '7', '8', '9'] or title[:2] == '问题':
            new_title_page_list.append(title_page_dict)
        else:
            continue
    return new_title_page_list
#############################################################
# 过滤GPT输出的列表
def Get_List(result: str):
    result = str(result).strip()
    if '[' not in result or ']' not in result:
        print('未找到中括号, 返回空列表')
        return []
    else:
        result = '[' + result.split('[')[1].split(']')[0] + ']'
        if '，' in result:
            result = result.replace('，', ',')
        if '"' in result:
            result = result.replace('"', '')
        if "'" in result:
            result = result.replace("'", '')
        if "\n" in result:
            result = result.replace("\n", '')
        return result

def Get_List_of_Dict(result: str):
    result = str(result).strip()
    if '[' not in result or ']' not in result:
        print('未找到中括号, 返回空列表')
        return []
    else:
        result = '[' + result.split('[')[1].split(']')[0] + ']'
        if '，' in result:
            result = result.replace('，', ',')
        if "：" in result:
            result = result.replace("：", ':')
        if "\n" in result:
            result = result.replace("\n", '')
        return result

# 过滤GPT输出的字典
def Get_Dict(result: str):
    result = str(result).strip()
    if '{' not in result or '}' not in result:
        print('未找到括号, 返回空字典')
        return {}
    else:
        if result[0] != '{':
            result = '{' + result.split('{')[1].split('}')[0] + '}'
        if '，' in result:
            result = result.replace('，', ',')
        if '：' in result:
            result = result.replace('：', ':')
        return result

# 将字典转换为格式化的字符串
def pretty_print_dict(d):
    return json.dumps(d, indent=4, ensure_ascii=False)


problem_type_dict = {
    "经营问题": {
        "中介机构": [
            "其他中介机构意见、声明",
            "保荐机构意见",
            "会计师、财务顾问意见",
            "律师意见",
            "中介机构规范性",
            "中介机构履职情况",
            "中介机构资格要求"
        ],
        "公司治理与规范运作": [
            "其他公司治理相关",
            "其他合规性核查",
            "实际控制人、股东及一致行动人相关情况",
            "独立性问题",
            "内部控制",
            "董监高及一致行动人相关情况",
            "股权结构情况",
            "股权激励与员工持股",
            "审批程序合规",
            "人员选聘与调整",
            "董事会运作",
            "竞业禁止、保密",
            "投资者保护",
            "投资者关系管理"
        ],
        "交易与关联交易": [
            "其他交易相关",
            "关联关系及其核查",
            "对外投资",
            "交易的评估、定价合理性、公允性",
            "关联交易目的及必要性",
            "关联交易",
            "客户或供应商关联",
            "出售资产情况",
            "关联方披露",
            "购买资产情况",
            "交易原因及必要性"
        ],
        "信息披露": [
            "其他信息披露相关",
            "信息披露存疑",
            "重大事项信息披露相关",
            "信息披露原则及规定"
        ],
        "重大事项": [
            "事项核查、澄清",
            "项目情况及实施进展",
            "诉讼、仲裁事项",
            "重大合同及其履行情况",
            "承诺事项",
            "财务性投资或类金融业务情况及核查",
            "破产、清算、注销",
            "资金拆借相关情况",
            "债权债务处理",
            "税收优惠相关",
            "政府补助",
            "并购重组"
        ],
        "风险提示与说明": [
            "其他风险提示与说明",
            "抗风险能力及风险揭示",
            "摊薄风险提示相关",
            "行业政策变更对发行人及募投项目的影响",
            "募投项目风险相关",
            "控制权变更风险"
        ],
        "合规交易与股权结构": [
            "其他股权结构相关",
            "股份增减持相关",
            "股份代持",
            "实际控制人认定相关"
        ],
        "募集资金": [
            "其他募集资金情况",
            "募资或募投项目合理性、必要性",
            "募集资金使用及进度安排"
        ],
        "募投项目": [
            "其他募投项目相关",
            "募投项目投资构成",
            "募投项目匹配情况",
            "募投项目与公司业务的协同性",
            "募投项目实施方式",
            "募投项目内容",
            "募投项目效益测算",
            "募投项目可行性",
            "备案及资质批复文件、审批手续相关",
            "募投项目实施情况",
            "新增产能合理性及消化措施",
            "募投项目运营模式",
            "与前次募投项目的关系",
            "募投项目实施主体"
        ],
        "企业销售": [
            "前五大客户",
            "境外销售情况",
            "招投标",
            "结算政策及结算方式"
        ],
        "核心竞争力分析": [
            "行业对比",
            "竞争对手"
        ],
        "风险揭示与信息披露": [
            "风险因素和重大事项提示",
            "风险揭示"
        ],
        "核心技术研发": [
            "核心技术人员G",
            "技术先进性",
            "合作研发"
        ],
        "企业采购": [
            "主要原材料采购情况",
            "前五大供应商",
            "采购价格的公允性"
        ],
        "企业生产": [
            "产能产量"
        ],
        "再融资认购对象": [
            "认购对象"
        ],
        "前次募集资金": [
            "其他前次募集资金情况",
            "前募资金使用情况与披露是否一致"
        ],
        "公司业务": [
            "产品质量"
        ],
        "历次资本运作": [
            "历次融资",
            "历次出售资产、股权",
            "历次增资"
        ],
        "持续盈利能力": [
            "持续经营能力"
        ],
        "重大资产重组": [
            "重组方案其他事项"
        ],
        "同业竞争": [
            "同业竞争"
        ],
        "新三板": [],
        "分拆上市": [],
        "公司产品及服务": []
    },
    "财务问题": {
        "利润损益": [
            "营业收入",
            "研发费用",
            "主营业务收入",
            "销售费用",
            "成本费用",
            "职工薪酬",
            "营业成本",
            "主营业务成本",
            "管理费用",
            "期间费用",
            "制造费用",
            "政府补助",
            "生产成本",
            "人工成本",
            "非经常性损益",
            "投资收益",
            "其他业务收入",
            "财务费用",
            "利润表",
            "汇兑损益",
            "扣非",
            "营业外收入",
            "营业外支出"
        ],
        "财务处理": [
            "收入确认",
            "股份支付",
            "函证",
            "勾稽关系",
            "会计政策和会计估计",
            "盘点",
            "成本核算",
            "走访",
            "减值测试",
            "跨期调整",
            "合并报表范围",
            "审计调整与会计差错更正",
            "资金管理",
            "费用资本化",
            "发票管理及报销",
            "利润分配",
            "融资租赁",
            "申报财务报表与其他财务报表差异",
            "金融工具"
        ],
        "流动资产": [
            "存货",
            "应收票据",
            "应收款项",
            "货币资金",
            "其他应收款",
            "预付款项",
            "交易性金融资产",
            "其他流动资产",
            "长期应收款"
        ],
        "盈利能力": [
            "毛利率",
            "期间费用率",
            "净利率"
        ],
        "非流动资产": [
            "固定资产",
            "无形资产",
            "在建工程",
            "商誉",
            "长期股权投资",
            "递延所得税资产",
            "其他非流动资产",
            "长期待摊费用",
            "投资性房地产",
            "可供出售金融资产"
        ],
        "资产减值准备": [
            "存货跌价准备",
            "坏账准备",
            "商誉减值",
            "资产减值准备",
            "固定资产减值准备"
        ],
        "其他资产负债": [
            "原材料采购",
            "资产负债表",
            "投资理财",
            "金融资产",
            "仓储",
            "银行借款",
            "委托贷款"
        ],
        "税务处理": [
            "增值税",
            "税务风险",
            "税收优惠",
            "免征、抵扣",
            "纳税申报"
        ],
        "现金流量": [
            "现金流量",
            "经营活动现金流",
            "投资活动现金流"
        ],
        "流动负债": [
            "应付账款",
            "预收款项",
            "其他应付款",
            "应付票据",
            "短期借款",
            "应付职工薪酬",
            "应交税费"
        ],
        "营运能力": [
            "存货周转率",
            "应收账款周转率"
        ],
        "非流动负债": [
            "预计负债",
            "长期借款",
            "长期应付款"
        ],
        "偿债能力": [
            "偿债能力",
            "资产负债率",
            "速动比率",
            "流动比率"
        ]
    },
    "法律问题": {
        "违法、行政处罚": [
            "证监会监管、处罚及整改",
            "其他有权机关立案调查、处罚及整改",
            "交易所监管、处罚及整改",
            "合规经营自查及整改",
            "违法违规",
            "行政处罚",
            "税务、海关处罚",
            "环保处罚",
            "工商处罚"
        ],
        "三类股东": [
            "股东为有限合伙企业",
            "股东为信托计划产品",
            "股东为资管计划产品",
            "股东为私募股权投资基金"
        ],
        "股权结构": [
            "股权变动",
            "股权代持",
            "股权结构",
            "对赌协议",
            "委托持股",
            "红筹架构",
            "工会及职工持股会持股",
            "交叉持股"
        ],
        "子公司与分公司": [
            "子公司与分公司",
            "子公司、分公司注销"
        ],
        "专利": [
            "专利",
            "专利涉及诉讼和纠纷",
            "共有专利",
            "实用新型",
            "无偿受让专利"
        ],
        "历史沿革": [
            "增资",
            "减资",
            "股权质押",
            "转增股本",
            "股份锁定安排",
            "整体变更时存在未弥补亏损",
            "集体企业改制"
        ],
        "控股、参股公司": [
            "控股、参股公司",
            "联营公司"
        ],
        "房屋": [
            "房屋",
            "未取得房屋所有权证"
        ],
        "股东出资": [
            "注册资本",
            "出资不实",
            "出资瑕疵",
            "无形资产出资",
            "实物出资",
            "出资未评估",
            "土地、房产出资",
            "债权出资"
        ],
        "租赁": [
            "租赁",
            "租赁房产",
            "租赁房产尚未取得权属证书",
            "房产租赁合同尚未办理备案手续",
            "房产租赁期限",
            "租赁土地"
        ],
        "土地使用权": [
            "土地取得未履行招拍挂",
            "土地被查封",
            "土地使用权",
            "集体土地使用权",
            "划拨土地使用权",
            "未取得土地使用权证",
            "闲置土地"
        ],
        "实际控制人": [
            "一致行动",
            "实际控制人认定",
            "共同控制",
            "无实际控制人",
            "实际控制人为省级人民政府",
            "实际控制人为香港居民"
        ],
        "诉讼或仲裁事项": [
            "诉讼或仲裁事项",
            "合同纠纷",
            "知识产权纠纷",
            "股权纠纷",
            "劳动纠纷"
        ],
        "企业股东": [
            "自然人股东",
            "国有股东",
            "股东关系",
            "外资股东",
            "持股5%以上股东"
        ],
        "历次申报": [
            "曾在新三板挂牌",
            "曾申报IPO",
            "曾申报联交所"
        ],
        "商标": [
            "商标",
            "商标涉及争议和诉讼",
            "商标到期或即将到期",
            "无偿受让商标",
            "商标申请被驳回"
        ],
        "社会保障": [
            ""
        ],
        "经营资质、许可、认证": [
            "高新技术企业",
            "排污许可",
            "安全生产许可",
            "强制性产品认证"
        ],
        "重组分立": [
            "重大资产重组",
            "股权收购",
            "吸收合并",
            "债务重组",
            "资产出售"
        ],
        "员工持股平台": [
            "员工激励计划",
            "闭环原则",
            "员工持股平台的普通合伙人",
            "员工持股平台含非员工"
        ],
        "著作权及域名": [
            "软件著作权",
            "域名"
        ]
    }
}

# 主版字典
# motherboard_dict = OrderedDict([('经营问题', OrderedDict([('中介机构', ['其他中介机构意见、声明', '保荐机构意见', '会计师、财务顾问意见', '律师意见', '中介机构规范性', '中介机构履职情况', '中介机构资格要求']), ('公司治理与规范运作', ['其他公司治理相关', '其他合规性核查', '实际控制人、股东及一致行动人相关情况', '内部控制', '独立性问题', '董监高及一致行动人相关情况', '股权结构情况', '审批程序合规', '股权激励与员工持股', '环保合规', '业绩真实性核查', '投资者关系管理', '投资者保护', '资金占用', '人员选聘与调整']), ('交易与关联交易', ['其他交易相关', '关联关系及其核查', '交易的评估、定价合理性、公允性', '关联交易目的及必要性', '客户或供应商关联', '对外投资', '关联交易', '出售资产情况', '交易原因及必要性', '关联方披露', '对外担保', '购买资产情况']), ('重大事项', ['项目情况及实施进展', '诉讼、仲裁事项', '财务性投资或类金融业务情况及核查', '事项核查、澄清', '重大合同及其履行情况', '资金拆借相关情况', '破产、清算、注销', '承诺事项', '债权债务处理', '媒体报道质疑', '并购重组']), ('风险提示与说明', ['其他风险提示与说明', '摊薄风险提示相关', '抗风险能力及风险揭示', '行业政策变更对发行人及募投项目的影响', '募投项目风险相关', '贸易摩擦风险']), ('合规交易与股权结构', ['其他股权结构相关', '股份增减持相关', '股份代持', '实际控制人认定相关']), ('募集资金', ['其他募集资金情况', '募资或募投项目合理性、必要性', '募集资金使用及进度安排', '募集资金用途']), ('信息披露', ['其他信息披露相关', '信息披露存疑']), ('募投项目', ['其他募投项目相关', '募投项目投资构成', '募投项目匹配情况', '募投项目与公司业务的协同性', '募投项目实施方式', '募投项目效益测算', '募投项目可行性', '新增产能合理性及消化措施', '备案及资质批复文件、审批手续相关', '募投项目实施情况', '募投项目内容', '募投项目运营模式', '募投项目实施主体']), ('核心竞争力分析', ['行业对比', '竞争对手', '核心竞争力']), ('企业销售', ['前五大客户', '结算政策及结算方式', '销售分区域情况', '客户集中度', '境外销售情况', '第三方回款']), ('企业采购', ['主要原材料采购情况', '采购价格的公允性', '前五大供应商']), ('企业生产', ['产能产量']), ('前次募集资金', ['其他前次募集资金情况']), ('公司业务', ['产品质量', '产品价格']), ('再融资认购对象', ['认购对象']), ('历次资本运作', ['历次融资', '历次出售资产、股权', '历次增资']), ('持续盈利能力', ['持续经营能力', '业绩下滑']), ('风险揭示与信息披露', ['风险因素和重大事项提示']), ('同业竞争', ['同业竞争', '发行人与控股股东存在同业竞争']), ('核心技术研发', []), ('重大资产重组', ['重组方案其他事项']), ('新三板', []), ('分拆上市', [])])), ('财务问题', OrderedDict([('利润损益', ['营业收入', '成本费用', '主营业务收入', '研发费用', '期间费用', '主营业务成本', '营业成本', '销售费用', '管理费用', '制造费用', '职工薪酬', '生产成本', '其他业务收入', '人工成本', '投资收益', '汇兑损益', '非经常性损益', '财务费用', '利润表', '扣非', '政府补助', '营业外支出', '营业外收入']), ('财务处理', ['收入确认', '股份支付', '函证', '盘点', '走访', '跨期调整', '勾稽关系', '成本核算', '减值测试', '会计政策和会计估计', '资金管理', '合并报表范围', '审计调整与会计差错更正', '利润分配', '发票管理及报销', '融资租赁', '费用资本化', '资本公积转增股本']), ('盈利能力', ['毛利率', '期间费用率', '净利率']), ('流动资产', ['存货', '应收款项', '应收票据', '货币资金', '其他应收款', '预付款项', '交易性金融资产', '其他流动资产']), ('其他资产负债', ['原材料采购', '仓储', '投资理财', '资产负债表', '金融资产', '银行借款']), ('非流动资产', ['固定资产', '在建工程', '无形资产', '商誉', '其他非流动资产', '长期股权投资', '长期待摊费用', '投资性房地产', '递延所得税资产', '工程物资', '生产性生物资产']), ('资产减值准备', ['存货跌价准备', '坏账准备', '资产减值准备', '固定资产减值准备', '商誉减值']), ('现金流量', ['现金流量', '经营活动现金流', '投资活动现金流', '现金及现金等价物', '筹资活动现金流']), ('税务处理', ['税务风险', '增值税', '税收优惠', '免征、抵扣', '税收政策', '纳税申报']), ('流动负债', ['应付账款', '应付票据', '短期借款', '其他应付款', '应付职工薪酬', '其他流动负债']), ('营运能力', ['应收账款周转率', '存货周转率']), ('非流动负债', ['预计负债', '长期借款', '长期应付款']), ('偿债能力', ['偿债能力', '资产负债率', '流动比率', '速动比率'])])), ('法律问题', OrderedDict([('违法、行政处罚', ['证监会监管、处罚及整改', '其他有权机关立案调查、处罚及整改', '交易所监管、处罚及整改', '合规经营自查及整改', '违法违规', '行政处罚', '环保处罚', '税务、海关处罚', '工商处罚', '消费者投诉']), ('股权结构', ['股权代持', '股权变动', '股权结构', '对赌协议', '委托持股', '工会及职工持股会持股', '红筹架构', '交叉持股']), ('三类股东', ['股东为有限合伙企业', '股东为信托计划产品', '股东为资管计划产品', '股东为私募股权投资基金']), ('子公司与分公司', ['子公司与分公司', '子公司、分公司注销']), ('控股、参股公司', ['控股、参股公司', '联营公司']), ('房屋', ['房屋', '未取得房屋所有权证']), ('历史沿革', ['增资', '减资', '转增股本', '股权质押', '集体企业改制', '股份继承', '国有企业改制', '股份锁定安排']), ('股东出资', ['注册资本', '出资瑕疵', '出资不实', '实物出资', '债权出资', '机器设备出资', '出资未评估', '土地、房产出资', '置换出资']), ('土地使用权', ['土地取得未履行招拍挂', '土地被查封', '土地使用权', '集体土地使用权', '划拨土地使用权', '未取得土地使用权证', '闲置土地']), ('租赁', ['租赁', '租赁房产', '租赁房产尚未取得权属证书', '房产租赁合同尚未办理备案手续', '租赁土地', '房产租赁期限']), ('专利', ['专利', '专利涉及诉讼和纠纷', '实用新型', '共有专利', '无偿受让专利']), ('实际控制人', ['一致行动', '实际控制人认定', '共同控制', '无实际控制人', '实际控制人为省级人民政府', '实际控制人为香港居民', '实际控制人拥有外国永久居留权']), ('诉讼或仲裁事项', ['诉讼或仲裁事项', '股权纠纷', '合同纠纷', '知识产权纠纷', '劳动纠纷']), ('经营资质、许可、认证', ['高新技术企业', '排污许可', '安全生产许可']), ('社会保障', ['']), ('企业股东', ['自然人股东', '国有股东', '股东关系', '外资股东', '持股5%以上股东']), ('商标', ['商标', '商标涉及争议和诉讼', '商标到期或即将到期', '无偿受让商标']), ('重组分立', ['重大资产重组', '股权收购', '债务重组', '吸收合并', '资产出售']), ('历次申报', ['曾申报IPO', '曾在新三板挂牌']), ('员工持股平台', ['员工持股平台的普通合伙人', '员工激励计划', '员工持股平台含非员工']), ('著作权及域名', ['软件著作权', '域名'])]))])
# 科创板字典
# innovation_dict = OrderedDict([('经营问题', OrderedDict([('中介机构', ['其他中介机构意见、声明', '保荐机构意见', '会计师、财务顾问意见', '律师意见', '中介机构规范性', '中介机构履职情况', '中介机构资格要求']), ('公司治理与规范运作', ['其他公司治理相关', '其他合规性核查', '实际控制人、股东及一致行动人相关情况', '独立性问题', '内部控制', '董监高及一致行动人相关情况', '股权结构情况', '股权激励与员工持股', '审批程序合规', '人员选聘与调整', '董事会运作', '竞业禁止、保密', '投资者保护', '投资者关系管理']), ('交易与关联交易', ['其他交易相关', '关联关系及其核查', '对外投资', '交易的评估、定价合理性、公允性', '关联交易目的及必要性', '关联交易', '客户或供应商关联', '出售资产情况', '关联方披露', '购买资产情况', '交易原因及必要性']), ('信息披露', ['其他信息披露相关', '信息披露存疑', '重大事项信息披露相关', '信息披露原则及规定']), ('重大事项', ['事项核查、澄清', '项目情况及实施进展', '诉讼、仲裁事项', '重大合同及其履行情况', '承诺事项', '财务性投资或类金融业务情况及核查', '破产、清算、注销', '资金拆借相关情况', '债权债务处理', '税收优惠相关', '政府补助', '并购重组']), ('风险提示与说明', ['其他风险提示与说明', '抗风险能力及风险揭示', '摊薄风险提示相关', '行业政策变更对发行人及募投项目的影响', '募投项目风险相关', '控制权变更风险']), ('合规交易与股权结构', ['其他股权结构相关', '股份增减持相关', '股份代持', '实际控制人认定相关']), ('募集资金', ['其他募集资金情况', '募资或募投项目合理性、必要性', '募集资金使用及进度安排']), ('募投项目', ['其他募投项目相关', '募投项目投资构成', '募投项目匹配情况', '募投项目与公司业务的协同性', '募投项目实施方式', '募投项目内容', '募投项目效益测算', '募投项目可行性', '备案及资质批复文件、审批手续相关', '募投项目实施情况', '新增产能合理性及消化措施', '募投项目运营模式', '与前次募投项目的关系', '募投项目实施主体']), ('企业销售', ['前五大客户', '境外销售情况', '招投标', '结算政策及结算方式']), ('核心竞争力分析', ['行业对比', '竞争对手']), ('风险揭示与信息披露', ['风险因素和重大事项提示', '风险揭示']), ('核心技术研发', ['核心技术人员G', '技术先进性', '合作研发']), ('企业采购', ['主要原材料采购情况', '前五大供应商', '采购价格的公允性']), ('企业生产', ['产能产量']), ('再融资认购对象', ['认购对象']), ('前次募集资金', ['其他前次募集资金情况', '前募资金使用情况与披露是否一致']), ('公司业务', ['产品质量']), ('历次资本运作', ['历次融资', '历次出售资产、股权', '历次增资']), ('持续盈利能力', ['持续经营能力']), ('重大资产重组', ['重组方案其他事项']), ('同业竞争', ['同业竞争']), ('新三板', []), ('分拆上市', []), ('公司产品及服务', [])])), ('财务问题', OrderedDict([('利润损益', ['营业收入', '研发费用', '主营业务收入', '销售费用', '成本费用', '职工薪酬', '营业成本', '主营业务成本', '管理费用', '期间费用', '制造费用', '政府补助', '生产成本', '人工成本', '非经常性损益', '投资收益', '其他业务收入', '财务费用', '利润表', '汇兑损益', '扣非', '营业外收入', '营业外支出']), ('财务处理', ['收入确认', '股份支付', '函证', '勾稽关系', '会计政策和会计估计', '盘点', '成本核算', '走访', '减值测试', '跨期调整', '合并报表范围', '审计调整与会计差错更正', '资金管理', '费用资本化', '发票管理及报销', '利润分配', '融资租赁', '申报财务报表与其他财务报表差异', '金融工具']), ('流动资产', ['存货', '应收票据', '应收款项', '货币资金', '其他应收款', '预付款项', '交易性金融资产', '其他流动资产', '长期应收款']), ('盈利能力', ['毛利率', '期间费用率', '净利率']), ('非流动资产', ['固定资产', '无形资产', '在建工程', '商誉', '长期股权投资', '递延所得税资产', '其他非流动资产', '长期待摊费用', '投资性房地产', '可供出售金融资产']), ('资产减值准备', ['存货跌价准备', '坏账准备', '商誉减值', '资产减值准备', '固定资产减值准备']), ('其他资产负债', ['原材料采购', '资产负债表', '投资理财', '金融资产', '仓储', '银行借款', '委托贷款']), ('税务处理', ['增值税', '税务风险', '税收优惠', '免征、抵扣', '纳税申报']), ('现金流量', ['现金流量', '经营活动现金流', '投资活动现金流']), ('流动负债', ['应付账款', '预收款项', '其他应付款', '应付票据', '短期借款', '应付职工薪酬', '应交税费']), ('营运能力', ['存货周转率', '应收账款周转率']), ('非流动负债', ['预计负债', '长期借款', '长期应付款']), ('偿债能力', ['偿债能力', '资产负债率', '速动比率', '流动比率'])])), ('法律问题', OrderedDict([('违法、行政处罚', ['证监会监管、处罚及整改', '其他有权机关立案调查、处罚及整改', '交易所监管、处罚及整改', '合规经营自查及整改', '违法违规', '行政处罚', '税务、海关处罚', '环保处罚', '工商处罚']), ('三类股东', ['股东为有限合伙企业', '股东为信托计划产品', '股东为资管计划产品', '股东为私募股权投资基金']), ('股权结构', ['股权变动', '股权代持', '股权结构', '对赌协议', '委托持股', '红筹架构', '工会及职工持股会持股', '交叉持股']), ('子公司与分公司', ['子公司与分公司', '子公司、分公司注销']), ('专利', ['专利', '专利涉及诉讼和纠纷', '共有专利', '实用新型', '无偿受让专利']), ('历史沿革', ['增资', '减资', '股权质押', '转增股本', '股份锁定安排', '整体变更时存在未弥补亏损', '集体企业改制']), ('控股、参股公司', ['控股、参股公司', '联营公司']), ('房屋', ['房屋', '未取得房屋所有权证']), ('股东出资', ['注册资本', '出资不实', '出资瑕疵', '无形资产出资', '实物出资', '出资未评估', '土地、房产出资', '债权出资']), ('租赁', ['租赁', '租赁房产', '租赁房产尚未取得权属证书', '房产租赁合同尚未办理备案手续', '房产租赁期限', '租赁土地']), ('土地使用权', ['土地取得未履行招拍挂', '土地被查封', '土地使用权', '集体土地使用权', '划拨土地使用权', '未取得土地使用权证', '闲置土地']), ('实际控制人', ['一致行动', '实际控制人认定', '共同控制', '无实际控制人', '实际控制人为省级人民政府', '实际控制人为香港居民']), ('诉讼或仲裁事项', ['诉讼或仲裁事项', '合同纠纷', '知识产权纠纷', '股权纠纷', '劳动纠纷']), ('企业股东', ['自然人股东', '国有股东', '股东关系', '外资股东', '持股5%以上股东']), ('历次申报', ['曾在新三板挂牌', '曾申报IPO', '曾申报联交所']), ('商标', ['商标', '商标涉及争议和诉讼', '商标到期或即将到期', '无偿受让商标', '商标申请被驳回']), ('社会保障', ['']), ('经营资质、许可、认证', ['高新技术企业', '排污许可', '安全生产许可', '强制性产品认证']), ('重组分立', ['重大资产重组', '股权收购', '吸收合并', '债务重组', '资产出售']), ('员工持股平台', ['员工激励计划', '闭环原则', '员工持股平台的普通合伙人', '员工持股平台含非员工']), ('著作权及域名', ['软件著作权', '域名'])]))])
# 创业板字典
# entrepreneurship_dict = OrderedDict([('经营问题', OrderedDict([('中介机构', ['其他中介机构意见、声明', '保荐机构意见', '会计师、财务顾问意见', '律师意见', '中介机构规范性', '中介机构履职情况']), ('公司治理与规范运作', ['其他公司治理相关', '其他合规性核查', '股权结构情况', '实际控制人、股东及一致行动人相关情况', '内部控制', '董监高及一致行动人相关情况', '审批程序合规', '独立性问题', '股权激励与员工持股', '环保合规', '业绩真实性核查', '人员选聘与调整', '员工人数']), ('交易与关联交易', ['其他交易相关', '关联关系及其核查', '交易的评估、定价合理性、公允性', '客户或供应商关联', '关联交易目的及必要性', '对外投资', '关联方披露', '关联交易', '出售资产情况', '交易原因及必要性', '关联方资金拆借']), ('信息披露', ['其他信息披露相关', '信息披露存疑', '信息披露原则及规定']), ('风险提示与说明', ['其他风险提示与说明', '抗风险能力及风险揭示', '摊薄风险提示相关', '行业政策变更对发行人及募投项目的影响', '募投项目风险相关', '贸易摩擦风险']), ('重大事项', ['项目情况及实施进展', '诉讼、仲裁事项', '重大合同及其履行情况', '财务性投资或类金融业务情况及核查', '资金拆借相关情况', '承诺事项', '破产、清算、注销', '事项核查、澄清', '债权债务处理', '事故', '并购重组']), ('合规交易与股权结构', ['其他股权结构相关', '股份增减持相关', '股份代持', '实际控制人认定相关']), ('募集资金', ['其他募集资金情况', '募资或募投项目合理性、必要性']), ('核心竞争力分析', ['行业对比', '竞争对手', '核心竞争力']), ('企业销售', ['前五大客户', '境外销售情况', '结算政策及结算方式', '第三方回款', '客户集中度', '客户变动']), ('募投项目', ['其他募投项目相关', '募投项目投资构成', '募投项目匹配情况', '募投项目实施方式', '募投项目效益测算', '募投项目与公司业务的协同性', '募投项目实施情况', '新增产能合理性及消化措施', '备案及资质批复文件、审批手续相关', '募投项目内容', '募投项目可行性', '募投项目运营模式']), ('企业采购', ['主要原材料采购情况', '采购价格的公允性', '前五大供应商', '采购的必要性、合理性']), ('企业生产', ['产能产量', '委托加工', '外协加工']), ('持续盈利能力', ['持续经营能力', '业绩下滑']), ('前次募集资金', ['其他前次募集资金情况']), ('公司业务', ['产品价格', '所处行业']), ('历次资本运作', ['历次融资', '历次出售资产、股权', '历次增资']), ('核心技术研发', ['核心技术人员G', '技术先进性']), ('风险揭示与信息披露', ['信息披露准确', '风险因素和重大事项提示']), ('再融资认购对象', ['认购对象']), ('公司产品及服务', ['产品价格']), ('同业竞争', ['同业竞争']), ('重大资产重组', ['重组方案其他事项']), ('新三板', []), ('分拆上市', [])])), ('财务问题', OrderedDict([('利润损益', ['营业收入', '主营业务收入', '成本费用', '销售费用', '研发费用', '营业成本', '期间费用', '主营业务成本', '管理费用', '职工薪酬', '制造费用', '人工成本', '生产成本', '其他业务收入', '扣非', '政府补助', '非经常性损益', '投资收益', '汇兑损益', '财务费用', '利润表', '营业外支出', '营业外收入']), ('盈利能力', ['毛利率', '期间费用率', '净利率']), ('财务处理', ['收入确认', '股份支付', '函证', '盘点', '走访', '跨期调整', '成本核算', '减值测试', '勾稽关系', '合并报表范围', '利润分配', '审计调整与会计差错更正', '发票管理及报销', '融资租赁', '资金管理', '会计政策和会计估计', '费用资本化', '金融工具', '同一控制下的企业合并', '申报财务报表与其他财务报表差异', '售后回租']), ('流动资产', ['存货', '应收票据', '应收款项', '货币资金', '其他应收款', '预付款项', '交易性金融资产', '其他流动资产', '长期应收款']), ('资产减值准备', ['存货跌价准备', '坏账准备', '商誉减值', '资产减值准备', '固定资产减值准备']), ('其他资产负债', ['原材料采购', '仓储', '投资理财', '资产负债表', '金融资产', '银行借款', '运输设备']), ('非流动资产', ['固定资产', '在建工程', '无形资产', '商誉', '长期待摊费用', '其他非流动资产', '长期股权投资', '递延所得税资产', '投资性房地产']), ('税务处理', ['税务风险', '增值税', '税收优惠', '免征、抵扣', '纳税申报', '税收政策']), ('流动负债', ['应付账款', '预收款项', '应付票据', '短期借款', '其他应付款', '应付职工薪酬']), ('营运能力', ['存货周转率', '应收账款周转率']), ('现金流量', ['现金流量', '经营活动现金流']), ('非流动负债', ['预计负债', '长期借款', '长期应付款']), ('偿债能力', ['偿债能力', '资产负债率', '流动比率', '速动比率'])])), ('法律问题', OrderedDict([('违法、行政处罚', ['合规经营自查及整改', '其他有权机关立案调查、处罚及整改', '证监会监管、处罚及整改', '违法违规', '交易所监管、处罚及整改', '行政处罚', '环保处罚', '税务、海关处罚', '工商处罚', '消费者投诉']), ('股权结构', ['股权变动', '股权代持', '股权结构', '对赌协议', '委托持股', '红筹架构']), ('子公司与分公司', ['子公司与分公司', '子公司的设立与业务经营', '子公司、分公司注销、转让', '子公司、分公司注销', '境外设立的子公司、分公司']), ('三类股东', ['股东为有限合伙企业', '股东为资管计划产品', '股东为信托计划产品', '股东为私募股权投资基金']), ('房屋', ['房屋', '未取得房屋所有权证']), ('历史沿革', ['增资', '转增股本', '减资', '股权质押', '股份锁定安排', '整体变更时存在未弥补亏损', '国有企业改制', '集体企业改制']), ('股东出资', ['注册资本', '出资瑕疵', '出资不实', '实物出资']), ('专利', ['专利', '专利涉及诉讼和纠纷', '实用新型', '共有专利', '专利为他人授权使用', '关联方拥有或使用与发行人业务相关的专利', '无偿受让专利']), ('租赁', ['租赁', '租赁房产', '租赁房产尚未取得权属证书', '房产租赁合同尚未办理备案手续', '租赁土地', '租赁生产线', '房产租赁期限']), ('控股、参股公司', ['控股、参股公司', '股东对外投资企业']), ('企业股东', ['股东关系', '自然人股东', '持股5%以上股东', '新股东引入', '国有股东', '外资股东']), ('土地使用权', ['土地取得未履行招拍挂', '土地被查封', '土地使用权', '集体土地使用权', '划拨土地使用权', '未取得土地使用权证']), ('诉讼或仲裁事项', ['诉讼或仲裁事项', '合同纠纷', '股权纠纷', '知识产权纠纷', '劳动纠纷']), ('实际控制人', ['一致行动', '实际控制人认定', '共同控制', '无实际控制人']), ('商标', ['商标', '商标涉及争议和诉讼', '关联方拥有或使用与发行人业务相关的商标', '授权使用商标', '商标到期或即将到期']), ('经营资质、许可、认证', ['高新技术企业', '排污许可', '安全生产许可']), ('社会保障', ['', '社会保障']), ('历次申报', ['曾在新三板挂牌', '曾申报IPO']), ('重组分立', ['重大资产重组', '股权收购', '吸收合并', '债务重组', '资产出售']), ('员工持股平台', ['员工激励计划', '员工持股平台的普通合伙人', '员工持股平台含非员工']), ('著作权及域名', ['软件著作权', '域名'])]))])


# 主版 问题分类二级字典
motherboard_dict = {0: '中介机构', 1: '公司治理与规范运作', 2: '交易与关联交易', 3: '重大事项', 4: '风险提示与说明', 5: '合规交易与股权结构', 6: '募集资金', 7: '信息披露', 8: '募投项目', 9: '核心竞争力分析', 10: '企业销售', 11: '企业采购', 12: '企业生产', 13: '前次募集资金', 14: '公司业务', 15: '再融资认购对象', 16: '历次资本运作', 17: '持续盈利能力', 18: '风险揭示与信息披露', 19: '同业竞争', 20: '核心技术研发', 21: '重大资产重组', 22: '新三板', 23: '分拆上市', 24: '利润损益', 25: '财务处理', 26: '盈利能力', 27: '流动资产', 28: '其他资产负债', 29: '非流动资产', 30: '资产减值准备', 31: '现金流量', 32: '税务处理', 33: '流动负债', 34: '营运能力', 35: '非流动负债', 36: '偿债能力', 37: '违法、行政处罚', 38: '股权结构', 39: '三类股东', 40: '子公司与分公司', 41: '控股、参股公司', 42: '房屋', 43: '历史沿革', 44: '股东出资', 45: '土地使用权', 46: '租赁', 47: '专利', 48: '实际控制人', 49: '诉讼或仲裁事项', 50: '经营资质、许可、认证', 51: '社会保障', 52: '企业股东', 53: '商标', 54: '重组分立', 55: '历次申报', 56: '员工持股平台', 57: '著作权及域名'}
# 科创版 问题分类二级字典
innovation_dict = {0: '中介机构', 1: '公司治理与规范运作', 2: '交易与关联交易', 3: '信息披露', 4: '风险提示与说明', 5: '重大事项', 6: '合规交易与股权结构', 7: '募集资金', 8: '核心竞争力分析', 9: '企业销售', 10: '募投项目', 11: '企业采购', 12: '企业生产', 13: '持续盈利能力', 14: '前次募集资金', 15: '公司业务', 16: '历次资本运作', 17: '核心技术研发', 18: '风险揭示与信息披露', 19: '再融资认购对象', 20: '公司产品及服务', 21: '同业竞争', 22: '重大资产重组', 23: '新三板', 24: '分拆上市', 25: '利润损益', 26: '盈利能力', 27: '财务处理', 28: '流动资产', 29: '资产减值准备', 30: '其他资产负债', 31: '非流动资产', 32: '税务处理', 33: '流动负债', 34: '营运能力', 35: '现金流量', 36: '非流动负债', 37: '偿债能力', 38: '违法、行政处罚', 39: '股权结构', 40: '子公司与分公司', 41: '三类股东', 42: '房屋', 43: '历史沿革', 44: '股东出资', 45: '专利', 46: '租赁', 47: '控股、参股公司', 48: '企业股东', 49: '土地使用权', 50: '诉讼或仲裁事项', 51: '实际控制人', 52: '商标', 53: '经营资质、许可、认证', 54: '社会保障', 55: '历次申报', 56: '重组分立', 57: '员工持股平台', 58: '著作权及域名'}
# 创业版 问题分类二级字典
entrepreneurship_dict = {0: '中介机构', 1: '公司治理与规范运作', 2: '交易与关联交易', 3: '信息披露', 4: '风险提示与说明', 5: '重大事项', 6: '合规交易与股权结构', 7: '募集资金', 8: '核心竞争力分析', 9: '企业销售', 10: '募投项目', 11: '企业采购', 12: '企业生产', 13: '持续盈利能力', 14: '前次募集资金', 15: '公司业务', 16: '历次资本运作', 17: '核心技术研发', 18: '风险揭示与信息披露', 19: '再融资认购对象', 20: '公司产品及服务', 21: '同业竞争', 22: '重大资产重组', 23: '新三板', 24: '分拆上市', 25: '利润损益', 26: '盈利能力', 27: '财务处理', 28: '流动资产', 29: '资产减值准备', 30: '其他资产负债', 31: '非流动资产', 32: '税务处理', 33: '流动负债', 34: '营运能力', 35: '现金流量', 36: '非流动负债', 37: '偿债能力', 38: '违法、行政处罚', 39: '股权结构', 40: '子公司与分公司', 41: '三类股东', 42: '房屋', 43: '历史沿革', 44: '股东出资', 45: '专利', 46: '租赁', 47: '控股、参股公司', 48: '企业股东', 49: '土地使用权', 50: '诉讼或仲裁事项', 51: '实际控制人', 52: '商标', 53: '经营资质、许可、认证', 54: '社会保障', 55: '历次申报', 56: '重组分立', 57: '员工持股平台', 58: '著作权及域名'}

# 行业字典
industry_dict = {
  "农、林、牧、渔业": [
    "农业",
    "林业",
    "畜牧业",
    "渔业",
    "农、林、牧、渔服务业"
  ],
  "采矿业": [
    "煤炭开采和洗选业",
    "石油和天然气开采业",
    "黑色金属矿采选业",
    "有色金属矿采选业",
    "非金属矿采选业",
    "开采辅助活动",
    "其他采矿业"
  ],
  "制造业": [
    "农副食品加工业",
    "食品制造业",
    "酒、饮料和精制茶制造业",
    "烟草制品业",
    "纺织业",
    "纺织服装、服饰业",
    "皮革、毛皮、羽毛及其制品和制鞋业",
    "木材加工和木、竹、藤、棕、草制品业",
    "家具制造业",
    "造纸及纸制品业",
    "印刷和记录媒介复制业",
    "文教、工美、体育和娱乐用品制造业",
    "石油加工、炼焦和核燃料加工业",
    "化学原料及化学制品制造业",
    "医药制造业",
    "化学纤维制造业",
    "橡胶和塑料制品业",
    "非金属矿物制品业",
    "黑色金属冶炼和压延加工业",
    "有色金属冶炼和压延加工业",
    "金属制品业",
    "通用设备制造业",
    "专用设备制造业",
    "汽车制造业",
    "铁路、船舶、航空航天和其他运输设备制造业",
    "电气机械和器材制造业",
    "计算机、通信和其他电子设备制造业",
    "仪器仪表制造业",
    "其他制造业",
    "废弃资源综合利用业",
    "金属制品、机械和设备修理业"
  ],
  "电力、热力、燃气及水的生产和供应业": [
    "电力、热力生产和供应业",
    "燃气生产和供应业",
    "水的生产和供应业"
  ],
  "建筑业": [
    "房屋建筑业",
    "土木工程建筑业",
    "建筑安装业",
    "建筑装饰和其他建筑业"
  ],
  "批发和零售业": [
    "批发业",
    "零售业"
  ],
  "交通运输、仓储和邮政业": [
    "铁路运输业",
    "道路运输业",
    "水上运输业",
    "航空运输业",
    "管道运输业",
    "装卸搬运和其他运输代理业",
    "装卸搬运和运输代理业",
    "仓储业",
    "邮政业"
  ],
  "住宿和餐饮业": [
    "住宿业",
    "餐饮业"
  ],
  "信息传输、软件和信息技术服务业": [
    "电信、广播电视和卫星传输服务",
    "互联网和相关服务",
    "软件和信息技术服务业"
  ],
  "金融业": [
    "货币金融服务",
    "资本市场服务",
    "保险业",
    "其他金融业"
  ],
  "房地产业": [
    "房地产业"
  ],
  "租赁和商务服务业": [
    "租赁业",
    "商务服务业"
  ],
  "科学研究和技术服务业": [
    "研究和试验发展",
    "专业技术服务业",
    "科技推广和应用服务业"
  ],
  "水利、环境和公共设施管理业": [
    "水利管理业",
    "生态保护和环境治理业",
    "公共设施管理业"
  ],
  "居民服务、修理和其他服务业": [
    "居民服务业",
    "机动车、电子产品和日用产品修理业",
    "其它服务业"
  ],
  "教育": [
    "教育"
  ],
  "卫生和社会工作业": [
    "卫生",
    "社会工作"
  ],
  "文化、体育和娱乐业": [
    "新闻和出版业",
    "广播、电视、电影和影视录音制作业",
    "文化艺术业",
    "体育",
    "娱乐业"
  ],
  "综合": [
    "综合"
  ]
}

# print(set(list(entrepreneurship_dict.values())) - set(list(motherboard_dict.values())))

# 错别字类型案例字典：
fix_typos_dict = {
'谐音字词': '配副眼睛-配副眼镜',
'混淆音字词': '流浪织女-牛郎织女',
# '中文拼音全拼': 'xingfu-幸福',
# '中文拼音缩写': 'SZ-深圳',
'形似字错误': '高梁-高粱',
'多字': '即减肥又又有营养-即减肥又有营养',
# '少字词语颠倒': '爱有天意-假如爱有天意',
# '词语跌倒': '伍迪艾伦-艾伦伍迪',
'搭配错误': '想象难以-难以想象',
}

sector_industry_dict = {"沪市主板": ['专用设备制造业', '通用设备制造业', '化学原料和化学制品制造业', '造纸和纸制品业', '电气机械和器材制造业', '计算机、通信和其他电子设备制造业', '医药制造业', '生态保护和环境治理业', '金属制品业', '汽车制造业', '商务服务业', '水上运输业', '农副食品加工业', '仪器仪表制造业', '非金属矿物制品业', '建筑装饰、装修和其他建筑业', '建筑安装业', '批发业'],
                        "深市主板": ['金属制品、机械和设备修理业', '印刷和记录媒介复制业', '计算机、通信和其他电子设备制造业', '专用设备制造业', '非金属矿物制品业', '通用设备制造业', '电气机械和器材制造业', '金属制品业', '化学原料和化学制品制造业', '橡胶和塑料制品业', '铁路、船舶、航空航天和其他运输设备制造业', '汽车制造业', '批发业', '电力、热力生产和供应业', '医药制造业'],
                        "科创板": ['通用设备制造业', '仪器仪表制造业', '其他制造业', '化学原料和化学制品制造业', '计算机、通信和其他电子设备制造业', '研究和试验发展', '有色金属冶炼和压延加工业', '专用设备制造业', '软件和信息技术服务业', '电气机械和器材制造业', '铁路、船舶、航空航天和其他运输设备制造业', '汽车制造业', '医药制造业', '专业技术服务业', '生态保护和环境治理业', '化学纤维制造业', '非金属矿物制品业', '橡胶和塑料制品业', '金属制品业', '废弃资源综合利用业', '互联网和相关服务', '食品制造业'],
                        "创业板": ['专用设备制造业', '软件和信息技术服务业', '计算机、通信和其他电子设备制造业', '化学原料和化学制品制造业', '批发业', '汽车制造业', '金属制品业', '医药制造业', '电信、广播电视和卫星传输服务', '通用设备制造业', '橡胶和塑料制品业', '互联网和相关服务', '铁路、船舶、航空航天和其他运输设备制造业', '电气机械和器材制造业', '非金属矿物制品业', '专业技术服务业', '研究和试验发展', '农副食品加工业', '造纸和纸制品业', '零售业', '仪器仪表制造业', '废弃资源综合利用业', '生态保护和环境治理业', '文教、工美、体育和娱乐用品制造业', '其他制造业', '卫生', '有色金属冶炼和压延加工业', '木材加工和木、竹、藤、棕、草制品业', '新闻和出版业', '纺织服装、服饰业', '家具制造业', '公共设施管理业', '食品制造业', '商务服务业', '教育', '土木工程建筑业', '住宿业', '化学纤维制造业', '综合', '酒、饮料和精制茶制造业', '皮革、毛皮、羽毛及其制品和制鞋业', '农业', '畜牧业', '纺织业', '房地产业', '装卸搬运和仓储业', '文化艺术业']}

